美国FDA告诉你:RNA-Seq完胜表达谱芯片!
对于生物基因表达的相关研究,基于芯片的Microarry和基于测序的RNA-Seq是近十几年来最热的技术。基因表达定量对于科研的重要性不言自明,特别是在精准医疗火热的大背景下,监管决策需要严格的评估,且各利益相关者之间需要达成共识。
在此背景下,去年,由美国FDA( Food and Drug Administration美国食品药品监督管理局)领导的测序质量控制联盟(SEQC)发表了一篇综述文章[1],综合评估了RNA-Seq的技术表现。此文主要通过5个相互独立但在内容上又互补的SEQC项目(图1),分别评估了检测基因的数量、准确性、低丰度基因的准确性、可重现性和信息含量、不同技术间的兼容性等指标。(详见发现1~6)
总的来说,RNA测序优势更大,更广的检测范围、低表达基因有更高的敏感性,在可变剪切和基因融合检测更具优势。
图1 SEQC项目整体研究设计
A、基于标准样品的核心定量研究。在3个测序平台和11个实验室评估RNA测序的准确性、
可重现性和信息含量。华大基因作为主要参与机构。
B、500个神经母细胞瘤预后研究[2]。华大基因作为主要参与机构,发现1、2和3。
C、27种化学处理超过100只大鼠肝脏的毒理研究[3],发现4和5。
D、利用RNA-Seq构建最完整大鼠表达谱。
E、芯片与RNA测序数据是否可以通用?[4],发现6。
F、更多研究
检测基因数量:RNA-Seq是芯片的2倍以上[2](图1B)
RNA测序鉴定出超过48,000个基因,而芯片不到一半,仅约21,000个。RNA测序中,4.52%的reads为新发现的外显子和Junction。注释出48,415个基因、204,352个转录本和319,231个外显子和Junction(图2)。
图2 RNA测序注释结果
(a reads比对比例、b 注释出的基因、转录本和Junction)
检测差异表达基因数量:RNA-Seq是芯片的2倍左右[2]
RNA测序检测出21,315个差异表达基因,而芯片仅有测序的一半,11,688个(图3)。RNA测序独特检测出的差异表达基因高达11,715个,而芯片仅有测序的18%,2,088个。
图3 RNA测序和芯片差异表达基因鉴定数
转录本变异体差异表达检测数量,RNA-Seq是芯片的8倍[2]
一个基因有多种转录本变异体,表达情况有时就比较复杂,有两种情况,(1)一个变异体差异表达,而另一个没有差异表达;(2)一个变异体上调,另一个下调。结果发现RNA测序在检测复杂转录本上比芯片更具优势。在RNA测序检测出的21,315个差异表达基因中,65.9%是情况1。这其中包含一些癌症基因,比如NF1和MDM4(图4)。RNA测序能鉴定出1,073个情况2的差异表达基因,而芯片只有129个(图5)。
图4 MDM4基因的转录变异体差异表达
(A S型转录本在ST4上调,B S型和FL型比值在ST4比值增高)
图5 癌症基因不同转录本差异表达检测的RNA测序和芯片比较
(A 根据注释情况、结构复杂性和蛋白编码能力分类,B 复杂调控的差异表达基因维恩图)
低丰度基因检测准确性,
RNA-Seq的qPCR验证率是芯片的5倍[3](图1C)
RNA测序在低丰度转录本检测上有更高的精确度。RNA测序比芯片在差异表达基因qPCR验证率上更优,93%比75%。分成高表达和低表达来看,两个平台在高表达的差异表达基因上与qPCR的一致性都很高,不过RNA-Seq更高一些,94%,芯片88%。但测序在低表达的基因qPCR验证率上远胜芯片,89%,而芯片仅有17%(图6)。
图6 不同丰度的差异表达基因, qPCR验证率的RNA测序和芯片比较
差异表达倍数准确性,RNA-Seq与qPCR相关性比芯片高14%[3](图1C)
差异表达倍数变化的响应上,RNA测序与qPCR相关性更好,R2=0.97,芯片相关性R2=0.85,高14%。在回归斜率上,RNA测序接近1,但芯片偏离1,向x轴倾斜(图7)。
图7 差异表达基因差异倍数与qPCR相关性的RNA测序和芯片比较
芯片与RNA测序数据是否可以通用?[4](图1E)
同样来自于SEQC/MAQC Consortium研究,标题为“An investigation of biomarkers derived from legacy microarray data for their utility in the RNA-seq era”(在RNA-seq时代,遗留的芯片数据产生的biomarker可用性调查)。
标题中毫不客气地指明这是RNA测序时代。测序取代芯片是必然的,然而在生物医学研究领域遗留了芯片提供的大量数据、预测模型和biomarker,这些是否可以直接用于RNA测序数据?文章利用两个大的临床数据集,498个神经母细胞瘤样品和175个急性骨髓性白血病样品,证实芯片和RNA测序数据biomarker研究是可以相互转移的(图8)。在即将到来的RNA测序时代,遗留下来的大量芯片数据持续可用于RNA测序数据。
图8 跨平台可转移性评估流程图
引用文献4标题来说,这是一个“RNA-seq era”(RNA测序时代)。
与基因芯片技术相比,RNA-Seq技术无需预先设计探针,即可对任意物种的任意细胞类型的转录本进行检测;能够提供更精确的数字化信号、更高的检测通量以及更广泛的检测范围。
过去测序价格昂贵,而近年来随着测序成本骤减,且数据质量和速度大大提升。再加上您以前做过的芯片数据可用于测序数据分析中,现在正是您做测序最好的时机。
选择我们,999元,15个工作日,含建库+测序20M clean reads +信息分析,我们等着您。
参考文献
[1] Xu J, Gong B, Wu L, et al. Comprehensive Assessments of RNA-seq by the SEQC Consortium: FDA-Led Efforts Advance Precision Medicine. Pharmaceutics. 2016 Mar 15;8(1). pii: E8.
[2] Zhang W, Yu Y, Hertwig F, et al. Comparison of RNA-seq and microarray-based models for clinical endpoint prediction. Genome Biology. 2015 Jun 25;16:133.
[3] Wang C, Gong B, Bushel PR, et al. The concordance between RNA-seq and microarray data depends on chemical treatment and transcript abundance. Nature Biotechnology. 2014 Sep;32(9):926-32.
[4] Su Z, Fang H, Hong H, et al. An investigation of biomarkers derived from legacy microarray data for their utility in the RNA-seq era. Genome Biology. 2014 Dec 3;15(12):523.
撰稿:赵 青
编辑:市场部
猜你喜欢
首篇文章发表!BGISEQ-500 RNA-Seq,不能错过的还有这些……
BGISEQ-500 PE100测序数据,到EBI一键下载!
7分钟!轻松掌握qPCR验证RNA-Seq定量结果(附案例)
近期热文
请继续关注“华大科技BGITech”公众号,
科技君将一如既往地为您提供精彩内容!
如有相关问题,欢迎后台留言~~
▼
关注华大科技,尽享精彩科研!